shadcn/improve propone una nueva forma de usar agentes de IA en el desarrollo

Los agentes de IA en el desarrollo de software llevan tiempo prometiendo más de lo que dan. Ahora empieza a tomar forma una idea diferente: usar el modelo más potente para entender el repositorio y escribir planes de mejora, pero no para tocar el código directamente. shadcn/improve aparece como una skill de agente con esa lógica: separa quién piensa de quién ejecuta, y convierte el plan en el producto final del modelo caro.

El enfoque responde a un problema que cada vez es más común en los equipos técnicos. Los modelos avanzados son buenos para entender bases de código complejas, detectar deuda técnica, priorizar riesgos y escribir especificaciones. Pero también son caros, y si se usan para cada cambio menor, cada refactorización o cada ajuste repetitivo, la factura puede crecer muy rápido. shadcn/improve intenta separar la inteligencia de la ejecución: el modelo caro piensa y planifica, y otro agente más barato ejecuta con instrucciones precisas.

El plan como producto, no el código generado

La filosofía de shadcn/improve cabe en una frase: el plan es el producto. La skill no toca el código fuente del proyecto. Su trabajo es inspeccionar el repositorio, identificar hallazgos, priorizarlos y generar planes de implementación autocontenidos en Markdown dentro de una carpeta plans/. Luego otro agente, o un desarrollador humano, puede ejecutar esos planes.

Esto cambia la forma de usar la IA en el desarrollo. En vez de delegar toda una tarea a un agente que improvisa sobre la marcha, el sistema obliga primero a documentar el problema, citar rutas de ficheros, incluir fragmentos del estado actual, definir pasos verificables, listar comandos de prueba y dejar explícitas las condiciones de parada. Es una forma de convertir el uso de IA en algo más parecido a cómo trabaja un tech lead: revisar, priorizar, especificar y ejecutar con control.

Comando	Uso principal
`/improve`	Auditoría completa del repositorio, hallazgos priorizados y planes
`/improve quick`	Revisión rápida y económica de los puntos más críticos
`/improve deep`	Auditoría exhaustiva por paquetes y categorías
`/improve security`	Revisión centrada en seguridad
`/improve branch`	Auditoría limitada a los cambios de la rama actual
`/improve next`	Sugerencias de evolución del proyecto basadas en evidencias
`/improve plan <descripción>`	Crea un plan concreto sin auditoría previa
`/improve review-plan <fichero>`	Critica y refina un plan existente
`/improve execute <plan>`	Delega la ejecución a un agente más barato y revisa el resultado
`/improve reconcile`	Actualiza el backlog de planes: verifica, desbloquea o retira items

Comando

Uso principal

/improve

Auditoría completa del repositorio, hallazgos priorizados y planes

/improve quick

Revisión rápida y económica de los puntos más críticos

/improve deep

Auditoría exhaustiva por paquetes y categorías

/improve security

Revisión centrada en seguridad

/improve branch

Auditoría limitada a los cambios de la rama actual

/improve next

Sugerencias de evolución del proyecto basadas en evidencias

/improve plan <descripción>

Crea un plan concreto sin auditoría previa

/improve review-plan <fichero>

Critica y refina un plan existente

/improve execute <plan>

Delega la ejecución a un agente más barato y revisa el resultado

/improve reconcile

Actualiza el backlog de planes: verifica, desbloquea o retira items

La instalación se presenta con un comando directo: npx skills add shadcn/improve. Funciona en agentes compatibles con el formato Agent Skills y genera los planes en texto plano, lo que hace que el resultado sea independiente de una sesión concreta con un modelo. Un plan puede leerlo otro agente, otro desarrollador o el equipo en una revisión interna.

Por qué separar auditoría y ejecución puede ahorrar dinero

El enfoque tiene sentido económico. En la programación asistida por IA, las partes más caras suelen ser las que requieren mayor comprensión: leer el repositorio, entender las convenciones, evaluar el impacto, detectar problemas reales y evitar falsos positivos. Ahí es donde un modelo de gama alta puede aportar más valor. Por el contrario, implementar una lista concreta de pasos, pasar tests, aplicar cambios mecánicos o corregir una duplicación localizada puede delegarse a un modelo más barato si el plan está bien escrito.

Lo clave es la calidad de la especificación. shadcn/improve escribe planes pensados para «el ejecutor plausible más débil», es decir, un agente que nunca vio la sesión con el advisor y que puede tener mucha menos capacidad de razonamiento. Por eso incluye contexto, rutas exactas, fragmentos de código, comandos de verificación, criterios de completitud y límites de alcance.

Fase	Modelo recomendado	Motivo
Reconocimiento del repositorio	Modelo potente	Necesita entender arquitectura, stack y convenciones
Auditoría de problemas	Modelo potente	Requiere juicio técnico y priorización
Escritura de planes	Modelo potente	Debe producir instrucciones completas y verificables
Implementación guiada	Modelo barato o humano	Sigue pasos definidos y acotados
Ejecución de tests	Agente barato o entorno local	Trabajo mecánico con salida verificable
Revisión final	Modelo potente o dev senior	Comprueba intención, alcance y calidad del diff

Fase

Modelo recomendado

Motivo

Reconocimiento del repositorio

Modelo potente

Necesita entender arquitectura, stack y convenciones

Auditoría de problemas

Modelo potente

Requiere juicio técnico y priorización

Escritura de planes

Modelo potente

Debe producir instrucciones completas y verificables

Implementación guiada

Modelo barato o humano

Sigue pasos definidos y acotados

Ejecución de tests

Agente barato o entorno local

Trabajo mecánico con salida verificable

Revisión final

Modelo potente o dev senior

Comprueba intención, alcance y calidad del diff

Los ahorros no vienen solo de usar menos el modelo caro. También pueden venir de reducir las iteraciones fallidas. Muchos costes de desarrollo con IA aparecen cuando el agente cambia demasiado, rompe tests, se sale del alcance o inventa una solución porque no entendía el contexto. Si el plan incluye condiciones de parada, comandos esperados y límites de alcance, el ejecutor tiene menos margen para desviarse.

Auditorías con evidencias, no recomendaciones genéricas

La skill no busca producir listas genéricas de «buenas prácticas». Durante la auditoría lanza subagentes por categorías como corrección, seguridad, rendimiento, cobertura de tests, deuda técnica, dependencias, experiencia del desarrollador, documentación y dirección del producto. Cada hallazgo debe estar respaldado por evidencia del propio repositorio, con referencias a ficheros y líneas.

Después el advisor relee los puntos citados antes de mostrarlos. Esta segunda revisión busca reducir falsos positivos, corregir atribuciones erróneas y registrar los rechazos para que no reaparezcan en ejecuciones futuras. En el ejemplo que comparte el proyecto, una supuesta alerta de SSRF vinculada a una variable https_proxy se rechaza como comportamiento esperado porque sigue una convención estándar usada por muchas herramientas CLI.

Categoría de auditoría	Lo que puede detectar
Corrección	Errores lógicos, casos límite o comportamiento inconsistente
Seguridad	Riesgos reales respaldados por evidencia en el código
Rendimiento	Algoritmos costosos, consultas ineficientes o trabajo duplicado
Tests	Áreas críticas sin cobertura suficiente
Deuda técnica	Duplicaciones, abstracciones rotas o migraciones incompletas
Dependencias	Actualizaciones, incompatibilidades o paquetes problemáticos
DX	Fricciones en el desarrollo, las pruebas o el despliegue
Documentación	Instrucciones incompletas u obsoletas
Dirección	Ideas de producto justificadas por el estado actual del repositorio

Categoría de auditoría

Lo que puede detectar

Corrección

Errores lógicos, casos límite o comportamiento inconsistente

Seguridad

Riesgos reales respaldados por evidencia en el código

Rendimiento

Algoritmos costosos, consultas ineficientes o trabajo duplicado

Tests

Áreas críticas sin cobertura suficiente

Deuda técnica

Duplicaciones, abstracciones rotas o migraciones incompletas

Dependencias

Actualizaciones, incompatibilidades o paquetes problemáticos

Fricciones en el desarrollo, las pruebas o el despliegue

Documentación

Instrucciones incompletas u obsoletas

Dirección

Ideas de producto justificadas por el estado actual del repositorio

Esta insistencia en la evidencia resulta útil porque uno de los grandes problemas de los agentes de código es el ruido. Un modelo puede detectar «problemas» que en realidad son decisiones deliberadas, deuda asumida o patrones propios del proyecto. Si cada hallazgo debe citar código concreto y pasar una revisión interna, el resultado se parece más a una auditoría técnica que a una lista de consejos genéricos.

Planes diseñados para sobrevivir fuera de la sesión

Los planes que genera shadcn/improve son autocontenidos. Incluyen el commit contra el que se escribieron, para que el ejecutor pueda comprobar si el código ha derivado antes de tocar nada. Si el código ha cambiado demasiado, el plan debe parar e informar del problema en vez de improvisar.

También incluyen «puertas de verificación». Cada paso termina con un comando y una salida esperada, lo que hace el éxito más medible. El agente no tiene que decidir si algo «parece hecho»; tiene que pasar tests, linting, compilación u otros criterios definidos por el propio repositorio.

Propiedad del plan	Valor para el equipo
Contexto inline	El ejecutor no depende de la conversación original
Rutas exactas	Reduce la exploración innecesaria
Fragmentos de código	Aclara el estado actual antes del cambio
Comandos verificados	Usa las herramientas reales del repositorio
Criterios de completitud	Evita cierres ambiguos
Condiciones de parada	Evita que un modelo pequeño improvise
Commit de referencia	Detecta si el plan ha quedado desfasado
Límites de alcance	Reduce los cambios colaterales no deseados

Propiedad del plan

Valor para el equipo

Contexto inline

El ejecutor no depende de la conversación original

Rutas exactas

Reduce la exploración innecesaria

Fragmentos de código

Aclara el estado actual antes del cambio

Comandos verificados

Usa las herramientas reales del repositorio

Criterios de completitud

Evita cierres ambiguos

Condiciones de parada

Evita que un modelo pequeño improvise

Commit de referencia

Detecta si el plan ha quedado desfasado

Límites de alcance

Reduce los cambios colaterales no deseados

Este enfoque puede encajar bien en equipos que ya usan issues, pull requests y revisiones. Los planes pueden publicarse como issues de GitHub con --issues, para que el trabajo llegue donde el equipo ya gestiona su backlog. Para organizaciones que quieren introducir agentes sin perder el control, es una idea práctica: la IA no reemplaza el proceso, escribe mejores elementos de trabajo que luego entran en él.

Ejecución aislada y revisión del resultado

La skill incluye también /improve execute <plan>, que despacha un ejecutor más barato en un worktree aislado, le pasa el plan y luego revisa el resultado. El flujo vuelve a pasar por los criterios de completitud, comprueba si el diff respeta el alcance y emite un veredicto: aprobar, pedir revisión o bloquear y refinar el plan.

El merge sigue estando en manos del usuario. El agente puede preparar una propuesta, pero no toma la decisión final de integrarla. Para muchos equipos, esa separación puede ser la diferencia entre usar la IA como asistente y dejar que modifique un producto sin supervisión suficiente.

Regla fija	Por qué importa
La skill no modifica el código fuente	Reduce el riesgo durante la fase de auditoría
Solo escribe en `plans/`	Limita el alcance de sus cambios directos
No ejecuta comandos que muten el árbol de trabajo	Evita efectos secundarios durante el análisis
No reproduce secretos	Solo informa de la ubicación y el tipo de credencial
Los ejecutores trabajan en worktrees desechables	Aísla los cambios y facilita la revisión
El merge sigue en manos del usuario	Mantiene el control humano sobre el repositorio

Regla fija

Por qué importa

La skill no modifica el código fuente

Reduce el riesgo durante la fase de auditoría

Solo escribe en plans/

Limita el alcance de sus cambios directos

No ejecuta comandos que muten el árbol de trabajo

Evita efectos secundarios durante el análisis

No reproduce secretos

Solo informa de la ubicación y el tipo de credencial

Los ejecutores trabajan en worktrees desechables

Aísla los cambios y facilita la revisión

El merge sigue en manos del usuario

Mantiene el control humano sobre el repositorio

También existe /improve reconcile, pensado para limpiar el backlog: verificar planes que ya se ejecutaron, investigar los bloqueados, refrescar los que han derivado y retirar hallazgos corregidos por otra vía. Esta parte es menos llamativa que el comando inicial, pero puede ser una de las más útiles. Los planes de mejora envejecen rápido si el repositorio cambia cada día.

Una señal de hacia dónde van los agentes de código

shadcn/improve no es solo una herramienta curiosa para usuarios de Claude Code, Codex u otros entornos compatibles. Apunta a una tendencia más amplia: los agentes de desarrollo necesitan procesos, límites y productos intermedios. Pedir «arregla mi repo» es demasiado abierto; pedir «audita, prioriza, escribe planes verificables y deja que otro ejecute» es mucho más controlable.

Este patrón se parece a cómo trabajan los equipos humanos. Un arquitecto o tech lead normalmente no implementa cada cambio. Analiza, decide prioridades, escribe tickets, revisa propuestas y valida resultados. La IA puede aportar valor en ese papel si tiene acceso al repositorio, entiende las convenciones y produce planes que otros puedan ejecutar.

La idea también encaja con la guerra de precios en los modelos de IA. Si los modelos más capaces siguen siendo caros, las empresas necesitarán reservarlos para tareas donde su razonamiento marque la diferencia. La ejecución mecánica, los cambios repetitivos y los tests pueden moverse a modelos más baratos o a herramientas automatizadas.

No sustituye la revisión técnica, pero puede subir el nivel base

La utilidad real dependerá de cada repositorio. Un proyecto pequeño puede no necesitar una auditoría tan estructurada. Un monorepo grande, con deuda técnica, migraciones pendientes y varios equipos, puede sacarle mucho más partido. También dependerá de la calidad del modelo usado como advisor y de la disciplina del equipo al revisar los planes antes de ejecutarlos.

No hay que presentarlo como un sustituto del desarrollador senior. Puede actuar como multiplicador: encuentra duplicaciones, convierte hallazgos dispersos en planes claros, genera issues accionables y evita que un agente barato trabaje sin contexto. Para muchos equipos, eso ya es un avance real.

La programación asistida por IA avanza más allá de los prompts improvisados. El siguiente paso son flujos de trabajo donde los modelos caros razonan, los baratos ejecutan, los tests verifican y los humanos mantienen la decisión final. shadcn/improve apunta exactamente en esa dirección: menos magia, más proceso y planes que se pueden revisar de verdad.

Preguntas frecuentes

¿Qué es shadcn/improve?

Es una Agent Skill que audita un repositorio, detecta posibles mejoras y escribe planes de implementación en Markdown para que otros agentes o desarrolladores los ejecuten.

¿Cómo se instala?

El proyecto indica que puede instalarse con el comando npx skills add shadcn/improve en entornos compatibles con el formato Agent Skills.

¿Modifica el código directamente?

No. La skill escribe los planes en la carpeta plans/. La ejecución puede delegarse a otro agente en un worktree aislado, pero el merge final queda bajo el control del usuario.

¿Por qué puede reducir los costes de IA?

Porque permite reservar el modelo caro para entender y planificar, y usar modelos más baratos para ejecutar tareas bien acotadas con comandos de verificación y límites claros.

COMPARTE ESTE ARTÍCULO

COMPARTIR EN FACEBOOK

COMPARTIR EN TWITTER

COMPARTIR EN LINKEDIN

COMPARTIR EN WHATSAPP

ARTÍCULO ANTERIOR

Los mejores sitios web para aprender a programar en 2026: guía por nivel y lenguaje